Una delle notizie che ha tenuto banco su diversi blog statunitensi e su alcune testate italiane la settimana appena trascorsa è stata quella relativa ad uno studio dell’Università di Princeton che Facebook avrebbe perso l’80% dei suoi utenti entro il 2017 e ciò avrebbe portato all’estinzione del social network.
I titoli sono stati piuttosto interessanti: Facebook sta per perdere l’80% dei suoi utenti, afferma uno studio (Time), Facebook perderà l’80% dei suoi utenti entro il 2017, affermano dei ricercatori di Princeton (Guardian), Ricercatori prevedono che Facebook morirà come una malattia (Io9), Facebook perderà l’80% dei suoi utenti entro il 2017 (Fast Feed).
Molto divertenti anche i titoli italiani: “Facebook perderà l’80% degli utenti in tre anni”: la Princeton studia il declino dei social media (La Repubblica), Facebook, dottorandi Princeton prevedono la catastrofe (TGCom 24), Facebook, una ricerca dell’Università di Princeton prevede crollo di iscritti nei prossimi anni (Huffington Post), Facebook: e’ come un virus, nel 2017 perdera’ 80% utenti (AGI), Facebook è come virus,perderà 80% utenti (ANSA)
E’ piuttosto semplice spiegare il successo della circolazione di questa ricerca: è da un po’ che girano notizie che Facebook avrebbe problemi con gli utenti adolescenti, l’antipatia strisciante verso questo social network totalizzante e l’interesse verso questi studi para-sociologici che permettono di sbizzarrirsi con le riflessioni su social media e società.
Quello che è ancora più interessante dal mio punto di vista è che metodologicamente parlando lo studio solleva non pochi problemi e questo ha portato ai data scientist di Facebook a reagire con una certa crudeltà verso la ricerca.
Andiamo per ordine.
Come tutte le malattie anche Facebook ha un ciclo di vita
Lo studio apparso sul database di pre-print scientifici arXiv dal titolo Epidemiological modeling of online social network dynamics, a firma di due dottorandi del Dipartimento di Ingegneria dell’Università di Princeton John Cannarella e Joshua A. Spechler, sostiene che Facebook tra il 2015 e il 2017 starebbe per perdere l’80% dei suoi utenti.
Come hanno fatto a giungere a questa conclusione?
I due autori hanno utilizzato come base dati la quantità di ricerche con il termine “Facebook” usando il servizio Google Trends (per chi non lo sapesse è lo strumento di Google che dice la quantità di ricerche che vengono fatte su specifiche parole chiave) e su questi dati hanno applicato un modello epidemiologico piuttosto famoso e ben conosciuto negli studi di Network Science, il modello SIR, a cui però loro hanno applicato delle modifiche sviluppando un modello alternativo che hanno chiamato modello irSIR (Infectius Recovery SIR) che ha permesso loro di aggiustare alcuni parametri e predire così la fuga degli utenti da Facebook nel 2017.
Come hanno fatto a sviluppare il modello irSIR?
Questo modello nasce dalla ricerca di una funzione che spiegasse il declino di MySpace a partire sempre dai dati forniti da Google Trends.
Trovata la funzione, l’hanno applicata agli stessi di dati di Facebook – et voilà – ecco la data della morte del social network più usato del mondo.
Non ci vuole un esperto per capire che qualcosa non funziona.
I modelli matematici devono avere un senso
I problemi sollevati da questo studio sono innumerevoli: li svilupperò in forma di elenco (giusto per chiarezza)
- I dati Google trends a cui è stato applicato il modello non sono dati pertinenti perché presuppone che le persone per andare su Facebook cercano la parola “Facebook” dentro Google è questo potrebbe essere vero in parte ma esclude tutti coloro che hanno Facebook come pagina di partenza, tutti coloro che sono perennemente loggati in Facebook, tutti coloro che usano Facebook con applicazioni mobili
- L’applicazione di un modello epidemiologico ad un processo non epidemiologico deve essere fortemente giustificato. Dire che i social network si evolvono come malattie nega processi sociali come la decisione di usare un social network, l’intenzionalità (azioni dirette ad uno scopo reale o simbolico) dell’agire umano, modelli più pertinenti come la diffusione delle innovazioni. Esistono studi che usano metafore biologiche modellizzate per spiegare alcune funzioni dei social network, ma quando lo fanno applicano un criterio di somiglianza (isomorfismo) e non di corrispondenza.
- Concettualmente usare MySpace come case study per perfezionare un modello epidemiologico è sbagliato due volte. In primo luogo perché i social network hanno caratteristiche sociologiche diverse, in secondo luogo perché MySpace si è “estinto” proprio a causa del successo di Facebook.
Queste sono le obiezioni che è possibile sollevare solo da un punto di vista sociologico.
Ma la reazione di Facebook non si è fatta attendere.
La sarcastica risposta di Facebook
I presupposti del paper e la metodologia adottata avevano fatto sollevare dubbi a non pochi osservatori e analisti.
La reazione (mooolto sarcastica) di Facebook è arrivata tramite un nota (Debunking Princeton) di Mike Develin, Data Scientist presso Facebook.
Usando la stessa “robusta metodologia” usata da Cannarella e Spechler, però applicandola stavolta al numero dei like sulle fanpage di tre celebri università – Princeton, Harvard, Yale – Develin afferma che mostrano un trend pericoloso ovverossia un drastico calo nell’interesse verso l’Università di Princeton.
Ma dato che Facebook non è un archivio della conoscenza umana, la stessa analisi è stata applicata alle citazioni su Google Scholar che fanno riferimento a studiosi di Princeton, e anche qui si nota un drastico calo nei paper a partire dal 2009.
Se ciò non bastasse, sono stati analizzati anche i dati relativi all’ammontare delle ricerche relative alla parola “Princeton” su Google Trends e i dati mostrano un fortissimo calo dell’interesse verso la celebre università del New Jersey.
Dati che si ritrovano anche rispetto alla parola “aria” cercata su Google Trends.
La conclusione di Develin è al vetriolo: “sebbene questa ricerca non è stata ancora sottoposta a peer-review, ogni “like” a questo post vale come peer-review. Cominciate a fare la revisione”.
Un case study pesantemente sociologico
Dal mio personale punto di vista, la vicenda del paper di Cannarella e Spechler sulla fine di Facebook entro il 2017 è un caso studio molto interessante da diversi punti di vista che – sempre per brevità e concisione – elenco qui in calce.
- L’applicazione di modelli a fenomeni socio-tecnici come il ciclo di vita dei social network è molto interessante ed è il campo di azione della Computational Social Science. Questo però non vuol dire che dobbiamo abbandonare una ideologia – la sociologia interpretative con pochi dati – a favore di un’altra – la sociologia computazionale con (near) Big data. Bisogna sempre usare intelligenza, pertinenza e buon senso. Quello che Charles Write Mills chiamava “Immaginazione sociologica”.
- Gli articoli relativi alla fine di Facebook si stanno codificando come un vero e proprio genere giornalistico in cui tutte le impostazioni sono lecite (la crescita di Snapchat, la ricerca di tal dei tali che rivela la morte di Facebook e cosi via dicendo). Che qualcosa stia scricchiolando nella costante crescita di Facebook è più di una sensazione ed ha un fondo di verità. Ma cerchiamo di stare attenti alle fin troppo facili conclusioni su la morte di X a favore di Y. Il mondo dei social media è fatto di sfumature di grigio. Come la vita.
- Questa vicenda apre una questione molto delicata sul fenomeno dei paper non sottoposti a peer review che entrano nel circuito comunicativo. Sarebbe molto interessante indagare chi è stato a far passare il paper da ArXiv al circuito mediatico fatto da testate online specializzate nell’analisi del mondo dei social media. A mio avviso è un classico caso di Scienza 2.0, ovvero un modo diverso di fare, comunicare, diffondere e istituzionalizzare il sapere scientifico.
- Questo caso solleva domande inquietanti sul mondo della scienza fatta coi Big data, dove “i dati parlano da soli” e “il passaggio da una scienza fatta di teorie ad una scienza fatta di dati”. Chiunque abbia fatto un corso di primo anno di metodologia della ricerca (sociologi, psicologi, economisti) o di filosofia della scienza (filosofi e umanisti) o ricerca operativa (informatici, matematici, ingegneri) sa che questa idea non solo è prova di senso ma è assolutamente pericolosa. Nessun dato per quanto dettagliato “parla da solo” per due motivi: i dati vengono raccolti con uno scopo, lo scopo per cui si raccoglie un dato è guidato da una teoria (implicita o esplicita poco importa). La statistica ci insegna che se noi troviamo una correlazione fra il periodo migratorio delle cicogne e la crescita delle nascita in un luogo questa non è una dimostrazione matematica del fatto che i bambini vengono portati dalle cicogne. Correlazione non vuol dire causazione.
- Una questione molto delicata è quella relativa alla politica comunicativa dei dati. Se l’oggetto della ricerca non fosse stato Facebook e la sua capacità di attirare l’attenzione e di rispondere da par suo con un fuoco di fila di data scientist di altissimo livello, ma una startup piccola e indifesa (dal punto di vista della comunicazione attraverso dati) le cose sarebbero andate diversamente? Si sarebbe stabilizzato nel buzz che – per esempio – è meglio non investire nella startup X poichè i dati mostrano un ciclo di vita poco stabile? La questione è molto delicata: per quanto le idee di un paper hanno come scopo l’avanzamento del sapere, le conseguenze sul mondo dell’impresa potrebbero essere molto pesanti.
Tutto questo mi ha portato alla mente una barzelletta sugli ingegneri.
Un scommettitore di corse di cavalli si rivolge ad un matematico, un fisico e un ingegnere chiedendo loro di risolvere il seguente problema: come faccio ad attribuire le quote delle corse in modo che il mio guadagno sia sempre ottimizzato?
Il matematico dopo due mesi di lavoro giunge alla seguente conclusione: “Il problema che mi poni ha una set di soluzioni possibili ma non so dirti quale siano queste soluzioni”.
Lo scommettitore se ne va piuttosto seccato.
Il fisico dopo un mese giunge alla seguente conclusione: “il problema presenta una soluzione ma non so dirti quale sia questa soluzione”
Lo scommettitore se ne va ancora più seccato.
L’ingegnere dopo una settimana gli fornisce una enorme quantità di dati che prendono in considerazione decine e decine di variabili – dalla velocità del cavallo, al peso del fantino, alle condizioni meteorologiche – e per ognuna ipotizza le quote da assegnare e il relativo guadagno.
Lo scommettitore strabiliato dice: “ma è pazzesco, davvero complimenti! Immagino che avrai dovuto fare dei calcoli davvero impossibili per giungere a questo risultati!”
L’ingegnere molto calmo risponde: “Macchè: i calcoli non sono stati un problema. Il vero problema è stato approssimare il cavallo ad una sfera…”